文本提取 - 智狐AI导航

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 632 浏览

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 564 浏览

CopyFish

一个免费的 OCR 程序，可从图片、视频和 PDF 文件中提取文本。

格式转换 2025年06月05日 81 点赞 0 评论 749 浏览

ExtractPDF

一款免费的在线PDF提取器。可从PDF文件中提取图像，文本和字体。Extract,PDF无需安装和注册就可以使用。

格式转换 2025年06月05日 35 点赞 0 评论 730 浏览

文本提取

首页

文本提取

列表

默认

浏览次数

发布日期

olmOCR

Versatile

CopyFish

ExtractPDF

文本提取 首页 文本提取

列表 默认 浏览次数 发布日期

olmOCR

Versatile

CopyFish

ExtractPDF

文本提取

首页

文本提取

列表

默认

浏览次数

发布日期